前华为天才少年稚晖君创业6个月造出人形机器人,百亿参数大模型加持、目标成本20万元以内
他,曾被 B 站老板陈睿盛赞重新定义“自行车”;
他,强势造了一个钢铁侠的机械臂,给葡萄做了一台精密的缝合手术;
他,附上一句「不是因为我们已经有把握把它做好,而是因为,这件事是我一直以来的热爱和梦想」,便决心舍弃百万年薪,离开华为,投身于自己热爱的机器人行业;
他是一名在 B 站上拥有 248.8 万粉丝的 UP 主——稚晖君,也是凭借过人的能力现担任智元 CTO、首席架构师的极客。
如今,距离他今年 2 月官宣创立「智元机器人(AGIBot)」公司仅仅过去了半年的时间,8 月 18 日 10 点 10 分,稚晖君带着一款智能新人——智元具身智能机器人远征 A1 惊艳亮相上海,还开了一场仅有 25 分钟“字少事大”的发布会。
身高 175cm、体重 53kg 的人形机器人远征 A1 正式亮相
在发布会上,稚晖君带来了关于远征 A1 的详细参数。
从外观上看,远征 A1 身高 175cm,体重 55kg。它人形机器人的设定,不仅是指它的外观像人,走路、动作都像人,最高步速可以达到 7km/h。
内置 RGBD 相机、激光雷达、IMU 和麦克风阵列,全身拥有 49 个自由度。
整机承重高达 80kg,相当于可以抱起一个成年男性。不过,它单臂最大负载只有 5kg。
稚晖君表示:“远征 A1 是智元的第一代通用型具身智能机器人,基于创始团队在机器人和 AI 行业多年的经验积累在半年内所打造,这款机器人未来将可以在各种复杂场景下自主完成移动和操作任务。我们致力于将先进的机器人和 AI 技术与人类生活以及生产制造紧密结合,未来让机器人成为人类的得力助手。”
在具体的技术维度,这一款人形机器人采用了该创业团队许多自研的软硬件技术。硬件维度:
自研核心关节电机 PowerFlow
这款名为 PowerFlow 的核心关节,具有体积小、重量轻、高功率密度、高能量利用效率、高响应带宽、耐冲击等一系列特性,峰值扭矩可达到 350Nm,重量为 1.6kg。
它决定着机器人各种动作的灵活性,使用了准直驱关节方案,实现了低齿槽转矩设计,搭配 10 速比以内的高力矩透明度行星减速器、共轭同轴双编码器、一体液冷循环散热系统,以及自研的矢量控制驱动器。
自研灵巧手 Skillhand
另一个非常值得关注的零件就是灵巧手。远征 A1 的灵巧手目前拥有 12 个主动自由度和 5 个被动自由度,所有驱动都是内置,并集成了基于视觉和触觉的指尖传感器,能够分辨操作物的颜色、形状和材质,可面向精密的操作场景应用。
具身智能
与行业内已经发布的人形机器人相比,远征 A1 最大的区别就是它叫「具身智能机器人」。所谓具身智能,是指通过创建软硬件结合的智能体。
统一软件框架 AgiROS
在软件维度,远征 A1 采用了统一软件框架 AgiROS,这款软件同样是智元机器人团队自主研发而成。
AgiROS 秉持轻量、易用、高性能、高扩展性,遵循现代开发范式,提供多种语言的接口,以插件形式兼容 ROS、ROS2 等机器人开发生态,以及 GRPC、HTTP 等云服务生态。
稚晖君表示,后续智元机器人会将 AgiROS 开源,提供详细的文档与 demo。
搭载语言任务模型 WorkGPT
大模型时代,要想实现领先,必须要有先进的 AI 技术加持。
在稚晖君看来,语言和图像大模型对于机器人领域应用最大的价值体现在两点:
1. 庞大的先验知识库&强大的通识理解能力。
这一点该怎么理解?在发布会现场,稚晖君分享了一个视频案例,即桌子上有一堆垃圾需要机器人捡起来丢到垃圾桶里面。随着大模型的到来,机器人其实已经从海量的数据集中学习了垃圾、垃圾桶等概念,无须我们再细分告诉它,什么是垃圾?垃圾应该丢到哪里去?大模型可以让机器人拥有强大的理解能力。
2. 复杂语义多级推理能力,所谓的“思维链”。
同样是视频演示说明,当我们要求机器人将“蓝色的方块放在红色方块下面”时,它要如何实现这一点?
这就需要运用到大模型举一反三的推理能力,然后可以把复杂的指令逐步分成步骤。
基于此,远征 A1 实现具身智能不可或缺的一环就是嵌入大模型。
这里远征 A1 采用了语言任务模型 WorkGPT,当人类用自然语言输出指令时,它能够很好地理解指令的具体含义。
在昨日的媒体沟通会上,该公司发言人表示,WorkGPT 并不是智元机器人创业团队从零研发的大模型产品,而是基于百亿开源模型调优而成,结合了 LLM 和 VLM 等 AI 技术,能够为机器人提供自主感知环境、理解任务、编排动作的能力,并且实现了思维链。
具身智脑 E-Brain
最后,智元机器人团队还研发了一款“具身智脑” EI-Brain 框架,把机器人的思维系统分为云端超脑,端侧的大脑、小脑,以及脑干。与之对应的是任务级、技能级、指令级以及伺服级四个层级。
其中技能级单独列出来,作为大脑,它可以像人类一样在任务执行过程中不断学习、抽象思考等。
除了以上,智元机器人团队还开发了多种运控算法。稚晖君表示,在短短几个月的研发实践中,其团队已经快速迭代了三版运控算法,可以说其已经拥有目前业界一梯队的最核心的算法研发能力。
计划成本控制在 20 万元的人形机器人,有什么用处?
智元机器人这家公司虽然是以技术为驱动,但更是一家面向应用落地的商业化企业。
因此,该团队表示,计划远征 A1 整机成本控制在 20 万元以内。
不过,相信很多用户也好奇,谁会为这款机器人买单?
根据发布会现场演示的视频以及昨日媒体沟通会上发言人所分享的内容,远征 A1 主要有以下主要应用场景。首先面向 ToB 行业,如:
汽车装配领域,人形机器人能够精准地执行繁琐的组装任务,提高生产效率和产品质量,同时降低人力成本。
3C 制造领域,人形机器人可以在电子产品的组装和检验过程中发挥关键作用,加快生产速度,减少缺陷率。
据悉,智元机器人团队已与国内头部制造企业正在洽谈合作。
未来,远征 A1 也有计划面向 ToC 端发售,为个人用户带来便利和支持,如:
厨师领域,人形机器人可以成为智能厨助,完成煮、煎、炸等操作;
家庭领域,可以执行家务任务,如清洁、整理,以及为家庭成员提供信息查询、娱乐等功能;
护理领域,人形机器人能够提供基本的陪伴、监测和紧急救援功能,特别是在老龄化社会中,为独居老人提供更多的安全感和关怀。
稚晖君与其创业团队
对于创业只有半年,便造出一款人形机器人样机,其实无论是从难度,还是时间来看,都是一个巨大的挑战。
据悉,该团队目前已经有 100 人,公司员工平均年龄只有 30 岁。
在智元看来,「用户不会为了人形机器人的灵活性动作而买单,而是会为了解决实际业务问题而付费」,作为智元机器人首款推出的产品,远征 A1 承载着该团队的梦想,也是其想要将「人形机器人大规模商业落地」的起点。
当下,属于这波年轻人的征途才刚刚开启,我们也期待智元机器人团队在未来能够带来更加耀眼的成果。
推荐阅读:
▶三天召集 2200+ 名黑客,齐向 AI “投毒”:“50 分钟内骗过 AI,第一名可获英伟达高端 GPU!”
▶OpenAI 宣布首笔收购,团队只有 8 人,原项目停更!
▶字节首个大模型独立App亮相;Nature发文:LK99不是室温超导体;Debian诞生30周年 | 极客头条